Fundamental limitations of genomic language models for realistic sequence generation
Dit onderzoek toont aan dat huidige genomische taalmodellen, zoals Evo 2 en megaDNA, fundamenteel tekortschieten in het genereren van realistische synthetische genomen omdat ze weliswaar lokale sequentiestatistieken kunnen nabootsen, maar falen in het behoud van langeafstandsorganisatie, herhalende elementen en evolutionaire beperkingen.